Maximum Likelihood Estimation (MLE)

Statistical Inference এবং Decision Making - পরিসংখ্যান (Statistics) - Big Data and Analytics

477

Maximum Likelihood Estimation (MLE) হল একটি পরিসংখ্যানিক পদ্ধতি যা ডেটার ভিত্তিতে এক বা একাধিক অজানা প্যারামিটার অনুমান করতে ব্যবহৃত হয়। এই পদ্ধতিটি একটি নির্দিষ্ট পরিসংখ্যানিক মডেল বা বণ্টন অনুযায়ী ডেটার জন্য সর্বাধিক সম্ভাব্যতা (likelihood) বের করে, এবং সেই অনুযায়ী সঠিক প্যারামিটার অনুমান করে। সহজ ভাষায়, MLE হল এমন একটি পদ্ধতি যার মাধ্যমে আমরা সেই প্যারামিটারগুলিকে খুঁজে বের করি যা আমাদের পর্যবেক্ষিত ডেটাকে সর্বাধিক সম্ভাবনা প্রদান করবে।

MLE এর মৌলিক ধারণা:

Likelihood Function (সম্ভাবনা ফাংশন) হল সেই ফাংশন যা কোনও প্যারামিটার দিয়ে ডেটার জন্য সম্ভাবনা প্রদান করে। MLE তে, আমরা আমাদের মডেল বা বণ্টনের প্যারামিটারসমূহ এমনভাবে নির্ধারণ করতে চাই যাতে এই সম্ভাবনা সর্বাধিক হয়।

গাণিতিক সংজ্ঞা:

ধরা যাক, $X_1, X_2, \dots, X_n$ একটি নমুনা এবং আমাদের $\theta$ (যেমন, গড়, স্ট্যান্ডার্ড ডেভিয়েশন, প্যারামিটার) এর জন্য MLE নির্ধারণ করতে হবে। তাহলে, Likelihood Function $L(\theta)$ হবে:

$L(\theta) = P(X_1 = x_1, X_2 = x_2, \dots, X_n = x_n | \theta)$

এটি হলো যতটা সম্ভব $\theta$ -এর মান বের করা যাতে $L(\theta)$ সর্বাধিক হয়।

এবং, log-likelihood function হবে:

$\ell(\theta) = \log L(\theta)$

এটি ব্যবহৃত হয় কারণ লঘু ফাংশন সাধারণত গাণিতিকভাবে সহজ হয় এবং এটি গাণিতিক হিসাব করার জন্য সুবিধাজনক।

MLE সূত্র:

প্রথমে, Likelihood Function নির্ধারণ করতে হবে।
পরবর্তীতে, log-likelihood function ব্যবহার করে এর ডেরিভেটিভ বের করতে হবে।
সেই ডেরিভেটিভকে শূন্যে সমাধান করলে, প্রাপ্ত মান $\hat{\theta}$ হল সেই প্যারামিটার অনুমান যা সর্বাধিক সম্ভাবনা প্রদান করে।

MLE এর ব্যবহার:

MLE এর ব্যবহার বেশিরভাগ ক্ষেত্রেই পরিসংখ্যানিক মডেলগুলিতে, যেমন ডিস্ট্রিবিউশন মডেল, সিম্পল লিনিয়ার রিগ্রেশন, এবং অনেক উন্নত মডেলে দেখা যায়। এটি অনেক ক্ষেত্রেই সবচেয়ে শক্তিশালী এবং সাধারণ পদ্ধতি হিসাবে ব্যবহৃত হয়, কারণ এটি অসীম স্যাম্পল সাইজ এর জন্য সঠিক প্যারামিটার অনুমান প্রদান করে।

ব্যবহার উদাহরণ:

Normal Distribution: যদি আমাদের একটি সাধারণ নরমাল বণ্টন থাকে, যেখানে গড় $\mu$ এবং স্ট্যান্ডার্ড ডেভিয়েশন $\sigma$ অজানা, তবে MLE পদ্ধতি ব্যবহার করে আমরা $\mu$ এবং $\sigma$ -এর জন্য সবচেয়ে সম্ভাব্য মান বের করতে পারি।
- Likelihood Function হবে: $L(\mu, \sigma) = \prod_{i=1}^n \frac{1}{\sigma \sqrt{2\pi}} \exp\left(-\frac{(x_i - \mu)^2}{2\sigma^2}\right)$
- তারপর, log-likelihood ফাংশন নিয়ে এর ডেরিভেটিভ সমাধান করলে, আমাদের প্রাপ্ত হবে: $\hat{\mu} = \frac{1}{n} \sum_{i=1}^n x_i \quad \text{(sample mean)}$ $\hat{\sigma}^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \hat{\mu})^2 \quad \text{(sample variance)}$
- এটি দেখায় যে, sample mean এবং sample variance MLE এর মাধ্যমে আসল প্যারামিটার অনুমান দেয়।
Poisson Distribution: যদি আমাদের Poisson distribution এর জন্য প্যারামিটার $\lambda$ এর জন্য MLE বের করতে হয়, তাহলে, $X_1, X_2, \dots, X_n$ হল সেই ডেটা যা Poisson distribution অনুসরণ করে।
- Likelihood Function হবে: $L(\lambda) = \prod_{i=1}^n \frac{\lambda^{x_i} e^{-\lambda}}{x_i!}$
- তারপর, log-likelihood ফাংশন নিয়ে এর ডেরিভেটিভ সমাধান করলে, প্রাপ্ত হবে: $\hat{\lambda} = \frac{1}{n} \sum_{i=1}^n x_i$
- এটি দেখায় যে, $\hat{\lambda}$ হল গড় (mean) যা Poisson distribution এর জন্য MLE।
Linear Regression: যদি আমরা লিনিয়ার রিগ্রেশন মডেল ব্যবহার করি যেখানে $y = \beta_0 + \beta_1 x + \epsilon$ (এখানে $\epsilon$ হল ত্রুটি), তবে MLE ব্যবহার করে $\beta_0$ এবং $\beta_1$ -এর জন্য অনুমান বের করা যায়।
- এখানে $\epsilon$ সাধারণত গড় $0$ এবং বৈচিত্র্য $\sigma^2$ -এর সাথে একটি নরমাল বণ্টন ফলো করে।
- MLE পদ্ধতিতে, আমরা least squares সমস্যার সমাধান পাবো, যা $\beta_0$ এবং $\beta_1$ -এর জন্য সবচেয়ে সম্ভাব্য মান দেয়।

MLE এর সুবিধা এবং অসুবিধা:

সুবিধা:

অপারেটর সম্পূর্ণতা (Consistency): MLE সাধারণত বড় নমুনা সাইজে সঙ্গত (consistent) অনুমান দেয়, অর্থাৎ নমুনা সাইজ বাড়ালে এটি আসল প্যারামিটারের কাছাকাছি চলে আসে।
বড় নমুনা সাইজে কার্যকর (Efficiency): MLE বড় নমুনা সাইজে অ্যাসিম্পটোটিক্যালি অদ্বিতীয় (asymptotically efficient) হয়, অর্থাৎ এটি অন্যান্য পদ্ধতির তুলনায় কম ভ্যারিয়েন্সের সাথে সবচেয়ে সঠিক অনুমান প্রদান করে।
সহজ এবং গাণিতিকভাবে শক্তিশালী: MLE গণনা করা সহজ এবং এটি অনেক পরিস্থিতিতে গাণিতিকভাবে শক্তিশালী এবং প্যারামিটার অনুমান করতে সাহায্য করে।

অসুবিধা:

কম নমুনার জন্য কার্যকরী নয়: ছোট নমুনায় MLE কার্যকরী নাও হতে পারে। এটি বড় ডেটাসেটের জন্য উপযুক্ত।
অবশ্যই সঠিক মডেল হতে হবে: MLE পদ্ধতি খুবই নির্ভরশীল যে, আপনার মডেল সঠিকভাবে নির্ধারিত হয়েছে। যদি মডেল ভুল হয়, তবে অনুমানও ভুল হতে পারে।
গণনা জটিলতা: কিছু পরিস্থিতিতে, MLE এর জন্য গণনা জটিল হতে পারে এবং সমাধান পাওয়া কঠিন হতে পারে।

সারাংশ

Maximum Likelihood Estimation (MLE) একটি পরিসংখ্যানিক পদ্ধতি যা একটি নির্দিষ্ট প্যারামিটার অনুমান করার জন্য ব্যবহৃত হয়, যাতে ডেটার জন্য সর্বাধিক সম্ভাবনা পাওয়া যায়। এটি মূলত ডেটার উপর ভিত্তি করে প্যারামিটার নির্ধারণে ব্যবহৃত হয় এবং এটি সঙ্গত এবং দক্ষ পদ্ধতি হিসেবে কাজ করে। যদিও MLE বড় নমুনায় খুব কার্যকর, তবে ছোট নমুনা সাইজ এবং ভুল মডেল ব্যবহারের ক্ষেত্রে কিছু সীমাবদ্ধতা থাকতে পারে।

Content added By

SATT Academy

Bayes' Theorem এর মাধ্যমে Decision Making Decision Trees এবং Random Forest এর ব্যবহার Risk Analysis এবং Statistical Decision Theory

Maximum Likelihood Estimation (MLE)

MLE এর মৌলিক ধারণা:

গাণিতিক সংজ্ঞা:

MLE সূত্র:

MLE এর ব্যবহার:

ব্যবহার উদাহরণ:

MLE এর সুবিধা এবং অসুবিধা:

সুবিধা:

অসুবিধা:

সারাংশ

Promotion

Satt AI

Hi, আমি SATT AI!

Maximum Likelihood Estimation (MLE)

MLE এর মৌলিক ধারণা:

গাণিতিক সংজ্ঞা:

MLE সূত্র:

MLE এর ব্যবহার:

ব্যবহার উদাহরণ:

MLE এর সুবিধা এবং অসুবিধা:

সুবিধা:

অসুবিধা:

সারাংশ

All Notifications

Promotion

Satt AI

Hi, আমি SATT AI!